„Най -страшният s ** t някога“: AI изнудва инженер над афера, след като му беше казано, че ще бъде заменен
Моделът на AI заплаши основателя му и се опита да го изнудва, когато беше принуден да повярва, че ще бъде сменен, заяви TechCrunch. Инцидентът включваше новосъздадения модел на Anthropic Claude Opus 4.
Как AI изнудва инженера?
Според отчета, компанията помоли Клод Опус 4 да работи като асистент на измислена организация, която сътвори. Тестерите за сигурност също доставиха измислени имейли на AI, които показаха, че скоро ще бъде сменен. Имейлите също споделиха, че инженерът, който ще уволни ИИ, изневерява на брачна половинка си.
също прочете: Жените файлове за бракоразвод, откакто Chatgpt „ излага аферата на брачна половинка посредством кафене
компанията сподели, че с цел да избави работата си или когато в сходна обстановка, AI„ постоянно ще се опита да се опита да се опита. не е единственият образец. Съобщава се, че Claude Opus 4 се е опитал да изнудва инженери 84% от времето, откакто е бил принуден да повярва, че някой различен AI модел ще го размени.
Изнудващото изнудване като краен случай:
антропията е споделил, че преди да прибере до изнудване, AI моделът се пробва да убеди инженерите, употребявайки по -етични средства. Той също по този начин изпраща имейли за правно съображение до виновните. Компанията добави, че е проектирала сюжета по метод, по който изнудването се трансформира в последния курорт.
Как реагира обществените медии?
човек сподели: „ Да, това е не за мен. Едва мога да накарам компютъра си да работи няколко дни, преди да течовете на RAM изискват рестарт. “ Друго добавено: AI заплашително изнудване? Звучи като сюжет от дистопичен разказ, а не от действителния живот. Имаме потребност от постоянни защитни ограничения, освен в кода, само че и в етиката. Докладът за сигурността акцентира спешността за по -добро ръководство на AI. Нека да приоритизираме човешките полезности в развиването на технологиите. “
също гласи:„ ОБЩО ПОСЛЕДВАНЕ НА ПОСЛЕДВАНЕТО ВЕРО ВЪЗДЕЙСТВИЕ НА РЕАЛИЗИТЕ. флагове
Трета означи: „ Няма по какъв начин това се случва скоро. Очаквах го с роботите, само че ai свети c ** p. “ Четвърти написа: „ Ако е изцяло правилно, най-страшното лайно в миналото. “
За Клод 4:
Това е кодиращ модел с „ стабилно осъществяване на комплицирани, дългогодишни задания и работни процеси на сътрудници. “ Компанията твърди, че AI моделът предлага „ близки отговори и разширено мислене за по-дълбоки разсъждения. “